Une approche multi-vue pour l'extraction terminologique bilingue
نویسندگان
چکیده
This paper presents a multi-view approach for term translation spotting, based on a bilingual lexicon and comparable corpora. We propose to study different levels of representation for a term: the context, the theme and the orthography. These three approaches are studied individually and combined in order to rank translation candidates. We focus our task on French-English medical terms. Experiments on our new model show a significant improvement of the classical context-based approach, with a precision score of 80.4% for the first ranked translation candidates. MOTS-CLÉS : extraction terminologique, lexique bilingue, corpus comparable
منابع مشابه
Approche générique pour l'extraction de relations à partir de textes
Résumé : Cet article s’intéresse à l’extraction de relations dans le contexte du web sémantique, en vue de procéder à de la construction d’ontologies aussi bien qu’à de l’annotation automatique de documents. Notre approche permet l’extraction de relations entre entités à partir de textes. Elle ne fait pas d’hypothèse sur les entités, de manière à la rendre aussi générique que possible, et à aut...
متن کاملA linguistic approach for knowledge extraction from an Arabic text (Une approche linguistique pour l'extraction des connaissances dans un texte arabe) [in French]
متن کامل
Une sélection multiple des structures d'optimisation dirigée par la méthode de classification K-means
Résumé. Le volume d’information contenu dans un entrepôt de données s’accroît sans cesse, augmentant de ce fait le temps d’exécution des requêtes décisionnelles. Pour y remédier, l’administrateur doit, durant la phase de conception physique de l’entrepôt, effectuer une sélection de structures d’optimisation (index, vues matérialisées ou fragmentation), puis assurer leur gestion et maintenance. ...
متن کاملPrise en compte des "points de vue" pour l'annotation d'un processus d'extraction de connaissances à partir de données
Résumé. Dans cet article on propose une nouvelle approche qui rend explicite la notion de point de vue dans une analyse multivues issue d’un processus d’Extraction de Connaissances à partir de Données (ECD). Par point de vue, nous entendons la vision particulière d’un analyste lors de son processus ECD, vision référant à un corps de connaissances qui lui est spécifique. On cherche, d’une part, ...
متن کاملChoix du taux d'élagage pour l'extraction de la terminologie. Une approche fondée sur les courbes ROC
Résumé. Le choix du taux d’élagage est crucial dans le but d’acquérir une terminologie de qualité à partir de corpus de spécialité. Cet article présente une étude expérimentale consistant à déterminer le taux d’élagage le plus adapté. Plusieurs mesures d’évaluation peuvent être utilisées pour déterminer ce taux tels que la précision, le rappel et le Fscore. Cette étude s’appuie sur une autre me...
متن کامل